再战Transformer!原作者带队的Mamba 2来了,新架构训练效率大幅提升 再战Transformer!原作者带队的Mamba 2来了,新架构训练效率大幅提升 关键词: Transformer,AI框架,Mamba 2,模型训练 自 2017 年被提出以来,Transformer 已经成为 AI 大模型的主流架构,一直稳居语言建模方面 C 位。 来自主题: AI技术研报 8563 点击 2024-06-04 17:36